“转录因子调控了哪些靶基因?”
今日推出完整解决方案V2.1
4种策略能够解决这个问题,总有一款适合你:
Plan A:RNA-seq。直接调控?间接调控?傻傻分不清
Plan B:ChIP-seq。最直接,最有效,与RNA-seq整合分析更准确
Plan C:ATAC-seq + motif分析。没有ChIP级别抗体,也能准确找到靶基因
Plan D:基于motif预测,这是个垫底儿的
小哈吐血整理 ~
老板骂小哈:你为了拉关注,把嘉因吃饭的本事都亮出来了!balabala。。。
呜呜~~,您再不点顶端蓝字,关注“嘉因”公众号,小哈就没饭吃了!
实验材料:
TF KD/KO/过表达或激活的处理组;
TF正常表达的对照组。
(本文转录因子简称“TF”)
实验方法:
RNA-seq,筛选上述两组样品的差异表达基因,推测TF调控的靶基因。
优点:
对实验技术要求不高,容易实现。
已发表的RNA-seq众多,如果能找到TF KD/KO/过表达或激活的两组对比数据,直接拿来分析,多快好省。
缺点:
TF KO/KD/过表达导致了gene1、gene2、gene3、gene4表达量的变化,可能是TF调控了gene1,gene1调控gene2,gene2调控gene3和4的结果。所以,用RNA-seq找的下游基因,直接调控?间接调控?傻傻分不清。
“怎样找到这样两组对比的已发表的RNA-seq数据?”
从GEO数据库www.ncbi.nlm.nih.gov/geo/搜索感兴趣的TF,在左侧点击Study type->Customize ...,勾选
点击右侧Top Organisms里的Homo sapiens (29),筛选出带有TP53字样的人的高通量测序表达谱数据。
往下拉,找TP53发生变化的样品的测序数据,找到不只一套
下载GSE89226_Gene_count_rpkm.txt.gz文件,查看差异表达基因,推测受TP53调控的基因。
想找直接调控的靶基因,就上Plan B和C
实验材料:
您感兴趣的细胞、组织;
TF的ChIP级别抗体。
怎么找抗体?看这篇《搜抗体,哪家强?| 人工智能帮你找抗体,BenchSci,实时显示引文Figure》
实验方法:
ChIP-seq,染色质免疫沉淀实验结合高通量测序,是在体内in vivo研究蛋白质与DNA结合关系的最有效方法。
简单讲ChIP-seq的原理:用TF的抗体抓TF,同时抓下来TF结合的DNA,提取DNA,测序,就知道TF结合了哪些DNA,推测DNA附近的基因受该TF的调控。
下面这些链接有详细介绍:
结合RNA-seq,能更准确的找到靶基因,还能推测出TF的功能是激活还是抑制,详见《ChIP-seq和RNA-seq整合分析,BETA最擅长》
优点:
直接找到TF结合的DNA,这是直接调控;
还能找到TF的collaborator;
目前已发表了5700多套人的ChIP-seq数据,小鼠的有4500多套,其他物种看这篇《做过ChIP-seq或ATAC-seq的物种速查》。如果有人做过您的TF的ChIP-seq,细胞类型也相近,就直接拿来看吧!
缺点:
依赖于抗体,如果没有好用的抗体,就没法做ChIP了。
“去哪找已发表的ChIP-seq数据?”
CistromeDB数据库,http://cistrome.org/db/,收录了已发表的人和小鼠2万多套ChIP-seq、DNase-seq和ATAC-seq数据,不断更新收录新数据。
查看您感兴趣的转录因子是否已经做过ChIP-seq,您感兴趣的细胞系有没有人做过DNase-seq或ATAC-seq,查询方法非常简单。可进入http://cistrome.org/db/#/tutorial查看教程,有视频讲解。
点击Get top putative targets,这个表里就是该转录因子调控的靶基因,还有motif,这个motif可能是该TF的,也肯能是TF的collaborator的,顺道还能找到TF的collaborator。
没有好用的ChIP抗体,怎么办?有Plan C。
实验材料:
您感兴趣的细胞或组织;
您感兴趣的TF的motif。
实验方法:
用DNase-seq或ATAC-seq找开放区,预示着这样的区域有调控因子结合。
在开放区找motif,如果有您感兴趣的TF的motif,那么这个TF很可能就在这里有结合,从而调控附近基因。
优点:
不依赖于抗体
缺点:
依赖于motif。
“去哪找已发表的ATAC-seq数据?”
去Plan B提到的CistromeDB里查找相近细胞类型的DNase-seq/ATAC-seq数据。如果没有已发表数据,就自己做。DNase-seq实验不稳定,世界上只有个别组能做好该实验;推荐做ATAC-seq,嘉因做得好。
“去哪找motif?”
Plan D里有详细方法。
如果没有相似细胞的ATAC-seq数据,就只能看motif了。
实验材料:
motif数据库;
或ChIP-seq数据。
实验方法:
每个转录因子都有一个DNA结合结构域(DBD),喜欢结合在特定DNA序列上,也就是motif。去基因组上搜索motif所在的位置,其附近的基因就有可能受该TF的调控。
优点:
每个转录因子都有DNA结合结构域,有特定的motif,不依赖于细胞类型,在物种间保守性极高,可以跨物种使用。目前TF数据库收录了大量TF的motif,还有上万ChIP-seq可以用来找motif。
缺点:
某个位置有motif,TF未必会结合;反之,没有motif,TF未必不结合,有可能TF1结合到TF2上或mediator上,再结合到DNA上,这里的TF广义的说是调控因子。
具体操作时涉及到以下3个问题,带具体操作方法:
“问题1:怎样找TF的motif?”
JASPAR数据库http://jaspar.genereg.net/收录的TF motif信息全、质量好。查询感兴趣的TF CEBPB,Search
那个彩色的高高低低的ATCG图就是motif logo
“问题2:motif在哪些基因附近?”
点击motif logo,查看详细信息
点击下方Binding sites information里的Bed file按钮,就能看到motif所在的位置信息。
bed file长这样
要直观的查看具体位置怎么办?
把上面的网页另存为文本文件,拖拽到IGV里,就能看到您关注的基因附近有没有该TF的motif。
哪些基因附近有这个motif呢?我要列表
用UCSC的Table Browser,https://genome.ucsc.edu/cgi-bin/hgTables,在region行选择position,点击最右边的define regions。
把bed文件的前三列粘贴进去
submit,回到Table Browser页面,点击get output,第二列就是基因名。到Excel里,把第二列复制粘贴出来,就是motif附近基因列表。
“问题3:如果motif的数据库里没有该TF的motif怎么办?”
用ChIP-seq找motif。
去Plan B的Cistome DB找ChIP-seq数据,即使不是您感兴趣的细胞类型,甚至是不同物种,这些数据还是有用的,用它找TF的motif。
还有哪些问题?请留言,下一个版本的解决方案就来解决您的问题。
福利
看到本文的小伙伴有福啦!加表观小助手微信号:epigenomics。把联系方式告诉她,给您送2018年学术台历。
组蛋白修饰的分布模式图、组蛋白修饰的半衰期、常用工具、研究策略。都印在台历上,老板再也不担心我记不住各种histone mark预示着什么了!
点击“阅读原文”直达技术贴目录。